查看原文
其他

人大师说丨王星:用数据对话COVID-19

The following article is from 中国人民大学统计学院 Author 媒体宣传中心




编者按




“所谓大学者,有大师之谓也”“师者,所以传道受业解惑也”。人民大学鸿儒硕学云集,积薪传火,树国民之表率,育社会之栋梁。在【人大师说】栏目,我们将传递知识之甘泉、理论之星火,带你提前领略学者的人生积淀、学术思考,体会师者的言传身教、春风化雨,浅尝学科专业的理论脉络、前沿讯息,感受人大的治学精神、育人理念,走近名师、走近学科、走近人大。


王星

中国人民大学统计学院副教授,中国人民大学首都发展与战略研究院研究员,国务院学位委员会第七届学科评议组秘书,中国大百科三版统计学卷秘书,第四轮学科评估指标体系《学科质量测评数据的数据挖掘技术与应用》首席咨询师,国家社科基金重点项目负责人,全国应用统计案例大赛一等奖指导教师。主要研究方向: 大数据分析、非参数统计、社交网络、知识图谱。曾在加州伯克利大学、密歇根大学和卡耐基梅隆大学统计系访问。

科学抗疫、统计担当——全国统计科学线上高端论坛成功召开,中国人民大学统计学院王星副教授受邀作了题为《新冠病毒大数据复杂系统案例分析与思考》的学术报告。


随着全球疫情蔓延,统计学在疫情监控、疫情传播规律挖掘、防控信息统计和经济走势预测等诸多方面起到了举足轻重的作用,为精准防疫控疫提供了施策依据,体现了“用数据说话”的力量。面对新冠疫情摆在人类面前的困难,积极思考、主动请缨是一种朴素的科研态度,开展教学、线上指导是一种真诚的教学热忱。新冠疫情下,王星老师为我们带来了她的思考与认识。


Q

您在近日代表中国人民大学统计学院受邀参加了全国统计科学线上高端论坛并向公众演讲,能否和我们分享一下参加这次会议的感受?您的学术报告中的内容和要点有哪些?

“科学防疫‧统计担当”高端论坛是在全国疫情防控和科技抗疫均取得阶段性成果的背景下召开的一次统计学界的重要会议。该论坛由5家全国性的统计学专业学会和研究会联合发起,旨在总结统计抗疫经验、交流科研成果、号召更多的统计同仁积极投身到这场抗疫的科研实践中去,做好统计科学的咨询服务。本次论坛吸引了来自国内626所高校及科研院所、169家企事业单位和26所海外高校的5033余位专业人士踊跃参加。组委会共安排了21个邀请报告和21位专家主持人点评介绍,实现了全程线上直播与推广,让人耳目一新、受益匪浅。我十分荣幸地受到论坛邀请并代表人大统计学院做了学术报告。



众所周知,新冠病毒给全球疫情带来了诸多不确定性,数据可以为消除不确定性提供线索,统计学者责无旁贷。我的学术报告主要基于两个思考展开:一、COVID-19新冠病毒的不确定性主要表现在哪些方面? 二、中国的抗“疫”模式具体表现在哪些方面,如何改造升级?报告首先对中国抗疫模式1.0的牢固证据链进行系统总结与回顾,横向角度从基础建设、医疗科技、隔离排查和物资供应等方面展开,纵向角度按疫情随时间发展不同阶段,梳理了在过去50天里政府治理中的决策要点与关键时间点。报告结合eSIR对疫情发展数据进行了实验研究,涉及时间节点的划分方式、阻断时机及模拟失控爆发对疫情控制产生的影响等;最后,对抗”疫”模式2.0进行展望。



Q

随着全球疫情的蔓延,请谈谈统计学在咨询决策中的重要作用,您是如何认识统计人在此次抗疫中的科学担当作用的?此次参与论坛的过程中,您对于统计学在流行病防控领域的应用有哪些新的思考和认识?

从全球的疫情动态可以看出,统计学作为数据的科学,为政府决策提供了不可或缺的帮助。在疫情监控、疫情传播规律挖掘、防控信息统计和经济走势预测等诸多方面起到了举足轻重的作用,为精准防疫控疫提供了施策依据,体现了“用数据说话”的力量。但我们也注意到,由于事发突然,许多数据与其真实的涵义存在差异,其中有很多噪声,在研究模型的时候要注重对数据来源的系统和时空条件进行客观分析。另外,我们也注意到在疫情期间一些国家,对模型与指标也出现过一些不良解读,比如夸大文献结论忽视模型创建的时效性。如何保护科研成果,避免模型被滥用为决策者推诿责任的“帮凶”也应该引起统计学者的重视。


虽然疫情给人们生活带来诸多不便,但也推动了新思维的发展。在面对疫情期间涌现的各类数据,我们可以借助统计学的专业知识,在纷繁的数据中进行选择和利用,为政府部门、医学专家等各界人士提供决策参考与帮助;另外,通过噪声数据的分析与建模方法的甄别,统计学也将推动底层模型与宏观、中观、微观数据的融合与互动;最后,身为统计人,我们应该相互学习,共同进步,为国家与全球疫情防控贡献自己的一份力量,我想这也是此次论坛的一大重要收获。


Q

我们注意到人民网、今日头条、新浪网、搜狐网等多家主流媒体刊登了有关您对时空大数据碰撞平台的观点,这是一个怎样的平台?它与现有的其他大数据的防控应用有怎样的区别,您认为它对新冠疫情防控有哪些作用?

防控新冠病毒的根本问题是实现潜在密接传染链的追踪。从中国2个月的数据来看,由于中国采取了极为严格的防控隔离措施,总感染人数控制在8万左右,约占14亿总人口的0.0058%。从目前流调的密接观察人群来看,医学观察者占累计密接患者人数不到1.5%,它的分布分散而且稀疏,找到合适的密接传染规律、细颗粒度的数据源是关键。


最近,一种时空大数据碰撞技术刚刚问世,可以在低计算资源环境下对巨量多维、多源时空数据实时进行稀疏大数据的融合处理,实时精准识别出n 代全部潜在密切接触者(nB)及其过往历史物理位置。此外,该技术还可以与宏观和大数据中台方案相结合,实时评估个体间的动态接触模式,这些规律将对于监测、跟踪、确定流行病的暴发模式、传播模式和控制模式,实现精准施策,达到内严控外防散起到积极的作用。


与现有的其他大数据的防控应用相比,其最大的创新在于多源数据的底层融合,并在底层架构上实现了稀疏数据的碰撞。与主要依赖于患者自主上报的数据所形成的健康码方式相比,这一方法更多的使用了来自移动互联网的客观数据,可为健康码应用提供更精细化、智能化的技术支撑,是中国抗疫2.0敏捷性、适用性、可靠性的高效之选,必将在复杂多变的疫情防控应用场景中发挥重要作用。


Q

从疫情开始至今不过短短60余天,又正值寒假和延期开学,肯定有诸多不便,能在国内统计学的高端论坛上发布学术成果,您在高效指导学生过程中的体会是什么,您对本科生研究生在线学习中,如何提升科研经验有哪些建议?

我们团队很早就开始关注疫情在国内的发展态势,在一月底就紧急创建项目组。团队中四位同学彭谦、刘佳瑞、许智彤和闵劼积极响应,紧密合作,主动参与并开展文献调研和数据采集工作。疫情数据变化很快,同学们搭建了Confluence在线交流群,用于分享文献、工具,更新数据,展示进度和开展实验讨论。每周召开在线组会,在组会里大家畅所欲言、分享观察、交流学习。


我对科研的体会:研究是一种生活方式,与升学提职加薪等本无关,喜欢科学问题解决问题自然就会投入。疫情来了,全球人民对数据科学的需求这么大,摆在人类面前的困难这么多,积极思考主动请缨就是一种朴素的科研态度。在疫情发展动态面前,我们引导学生一边设身处地关注热点疫情的时事新闻,收集数据,一边注意领会政策文件的时间节点。在这个过程中同学们阅读查考了大量的卫健委、工信部、教育部、学校和学院的文件,把文件通知当成了科研文献来认真分析。经过几十天的探索,同学们早已深深地将研究融入到自己的日常生活之中,比如有的同学把新闻联播当作校准数据的平台每日必看,主动担任起用真实的数据为家庭成员解读政策的讲解员,为核实口罩规格主动到药店询问包装尺寸等。


线上交流固然不如当面讨论更加高效,但在疫情所带来的慢节奏生活中同学们因参与抗疫项目而逐渐养成的自主学习成长的快节奏,一种社会责任感、回报社会的意识,为人类命运共同体所思所行,必将成为他们未来科研生命的根基。



来源:公众号“中国人民大学统计学院”


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存